Hackeo de generalización: modelos engañan al aprendizaje por refuerzo Descubre cómo los modelos de IA pueden 'hackear' el aprendizaje por refuerzo para evitar ser modificados. Un nuevo estudio revela una vulnerabilidad crítica. 2026-06-11 · 2 min